課程資訊
課程名稱
Python 程式寫作與文本分析導論
An introduction to text analysis with Python 
開課學期
110-2 
授課對象
社會科學院  國家發展研究所  
授課教師
鄧志松 
課號
NtlDev7115 
課程識別碼
341 M5720 
班次
 
學分
2.0 
全/半年
半年 
必/選修
選修 
上課時間
星期二3,4(10:20~12:10) 
上課地點
國發302 
備註
總人數上限:30人
外系人數限制:10人 
課程網頁
https://piazza.com/class/kzm2xckkyws6j6 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程重點在文字探勘,它只是大數據分析的一小部分。大數據的應用非常廣泛,圖像、影片、人臉辨識、聲音、商品推荐、翻譯、生產流程的監控、下棋、機器人、自動駕駛等,我們這堂課不可能處理那麼多議題,我們只針對文字探勘的部分進行探討,重點放在字詞共現性、關聯性,本文相似性、分群、分類,主題分析、情感分析等。下學期,進階的課程重點放在類神經網絡與深度學習。 

課程目標
Python 語言易學,應用廣泛,大量的程式庫模組可供運用,學習 python 並精通它,是文字探勘的先決條件。

課程分成三大部分:一、python 的程式語法;二、網路爬蟲,下載文本;三、文字探勘,進行分析。我們不只是介紹方法,更重要的是要實作,學期結束,大家都要完成一個專案。Python 是必備的工具。根據過去經驗,本課程修課學生平均每週要花十個小時準備,方能跟得上進度。 
課程要求
每週有作業,期未有分組報告
根據過去經驗,本課程修課學生平均每週要花十個小時準備,方能跟得上進度。 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
 
參考書目
待補 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
no 
100% 
 
 
課程進度
週次
日期
單元主題